home *** CD-ROM | disk | FTP | other *** search
/ Sigcat 1994: Conference Disk / SIGCAT 94 Conference Disk - DataDisc.ISO / gsbuild / gsbuild.doc < prev    next >
Encoding:
Text File  |  1994-04-11  |  29.5 KB  |  792 lines

  1. GSBUILD.DOC                                         04/04/94
  2.  
  3.   This file contains information on programs in the GSBUILD/GSSEARCH
  4.   system.  
  5.  
  6.  
  7. PROCEDURES
  8.  
  9.   
  10.  
  11.  
  12. PROGRAMS
  13.  
  14.  
  15.   GBMK_ADR.EXE
  16.  
  17.       Reads binary db_name.LV4 file and translates it into ASCII data
  18.       offsets file (default name = SIZE.TXT).
  19.  
  20.       GBMK_CFG then reads db_name.TMP and SIZE.TXT to make db_name.CFG.
  21.  
  22.       NOTE:  db_name is the filename path\prefix of the data base.
  23.  
  24.       Generates GBMK_ADR.ERR file if a processing error is encountered.
  25.  
  26.  
  27.       GBMK_ADR Command Line Format:
  28.  
  29.         GBMK_ADR db_name.LV4 siz_file <ENTER>
  30.  
  31.           db_name.LV4:  See GSSEARCH.DOC.
  32.  
  33.           siz_file:     See SIZE.TXT information.
  34.  
  35.       Versions:  
  36.  
  37.         1.0   93/08/23
  38.  
  39.  
  40.   GBMK_CFG.EXE
  41.  
  42.       Reads temporary configuration file (db_name.TMP) and data offsets file
  43.       (SIZE.TXT) and makes a configuration file for GSSEARCH.
  44.   
  45.       NOTE:  db_name is the filename path\prefix of the data base.
  46.  
  47.       The configuration file name is taken from the first line of the
  48.       db_name.TMP file.  Copies the pointer and data file names, the
  49.       numbers of fields, indexes, and browse formats, and the title line
  50.       from db_name.TMP to the db_name.CFG file.  Then for each index field
  51.       copies the index names, types, and data field number and merges the
  52.       pointer data for that field from SIZE.TXT, and outputs the combined
  53.       line to db_name.CFG file.  Then copies the data field information and
  54.       browse format information from the db_name.TMP file to the
  55.       db_name.CFG file.
  56.  
  57.       Generates GBMK_CFG.ERR file if a processing error is encountered.
  58.  
  59.       GBMK_CFG Command Line Format:
  60.  
  61.         GBMK_CFG tmp_file siz_file <ENTER>
  62.  
  63.           tmp_file:     Temporary configuration file for the data
  64.                         base.
  65.                         Default name:  db_name.TMP.
  66.   
  67.           siz_file:     ASCII file produced by GBMK_ADR.EXE.
  68.                         Default name:  SIZE.TXT.
  69.   
  70.       Versions:  
  71.  
  72.         1.5   94/04/04
  73.            Revised to accomodate inclusion of # of decimal places in
  74.              numeric field length.
  75.         1.4   93/10/21
  76.            Added test for too many lines of data in SIZE.TXT file.
  77.            Added removal of bad .CFG file if errors are encountered.
  78.         1.3   93/09/23
  79.            Fixed left justification of index and field names.
  80.         1.2   93/08/15
  81.            Revised command line message trigger and added output
  82.              of GBMK_CFG.ERR file.
  83.         1.0   93/07/14
  84.  
  85.  
  86.   GBMK_GBG.EXE
  87.  
  88.       Reads TAGGED TEXT files and db name.SCR file and generates the
  89.       db_name.GBG file.
  90.   
  91.       NOTE:  db_name is the filename path\prefix of the data base.
  92.   
  93.       Generates GBMK_GBG.ERR file if a processing error is encountered.
  94.  
  95.  
  96.       GBMK_GBG Command Line Format:
  97.  
  98.         GBMK_GBG inf_file db_name scr_file [/a] <ENTER>
  99.  
  100.           inf_file:     ASCII file containing the path/names of
  101.                         input tagged data files.  GBMK_GBG will process
  102.                         all of the listed files, to produce a single
  103.                         db_name.GBG file.  
  104.                         Default name:  db_name.INF
  105.  
  106.           db_name:      This is the path/prefix to which .GBG will be
  107.                         appended to make the db_name.GBG file.
  108.   
  109.           scr_file:     Name of the script file for the data base.
  110.                         Default name:  db_name.SCR 
  111.   
  112.           /a             Switch to append to an existing .GBG file (optional)
  113.   
  114.       Versions:  
  115.  
  116.         2.0   94/02/18
  117.            Revised record counter.
  118.         1.9   94/01/18
  119.            Added tests for disk space.
  120.         1.8   93/12/21
  121.            Added skip of 0x00 stopchar if Format == 0.
  122.         1.7   93/10/13
  123.            Increased size of GBG buffer to match TAG buffer.
  124.         1.6   93/10/13
  125.            Modified to insert 0xFF between paragraphs of non-formatted
  126.              field.
  127.         1.5   93/09/28
  128.            Modified parsing of non-formatted field to remove extra
  129.              spaces after CR/LF.  
  130.         1.4   93/08/30
  131.            Made ReadTagFile function and removed tests for reads 
  132.              after each increment of TagPos.  Tag file is read when
  133.              < 0x6000 bytes are left in buffer (1 max size rec + 
  134.              512 field tags.)
  135.         1.3   93/08/19
  136.            Made ReadTagFile function and added tests for reads 
  137.              after each increment of TagPos.
  138.         1.2   93/08/15
  139.            Revised command line message trigger and added output
  140.              of GBMK_GBG.ERR file.
  141.         1.1   93/07/14
  142.            
  143.  
  144.   GBMK_TAG.EXE
  145.  
  146.       Converts dBase file to a TAGGED.TXT file.
  147.       Deleted records (marked by a non-space in the delete-rec-marker
  148.         byte are not processed.
  149.       Null (empty) fields are not converted.  
  150.       Numeric fields that have all zeros or zeros with decimal point will 
  151.         not be converted if the /0 flag is set in the command line.
  152.       Memo file data is translated as is.  There is no conversion of 
  153.                extended ASCII characters.
  154.     
  155.       Generates GBMK_TAG.ERR file if a processing error is encountered.
  156.  
  157.       GBCHKTAG.EXE may be used to check a .TAG file for errors, and to
  158.         generate a list of field names.
  159.  
  160.       Command line format:
  161.  
  162.         GBMK_TAG dbf_file tag_file [/n=numrecs] [/0] <ENTER>
  163.  
  164.           dbf_file:     The path\name of the input DBF file.
  165.  
  166.           tag_file:     The path\name of the output tagged text file.
  167.  
  168.           numrecs:      Number of records to convert, default = all records.
  169.                       
  170.           option:  /0   Ignore null (0) numeric fields.
  171.  
  172.       Versions:  
  173.  
  174.         2.3   94/03/23
  175.            Added command line input of number of records to convert.
  176.         2.2   94/02/18
  177.            Revised record counter.
  178.         2.1   94/01/18
  179.            Revised error messages.
  180.         2.0   93/08/15
  181.            Fixed bugs in text/binary reads.
  182.            Added skip of deleted record.
  183.            Added seek to end of header.
  184.         1.0   93/07/14
  185.  
  186.  
  187.   GB_INDEX.EXE
  188.  
  189.       Reads db_name.SCR file and spawns the programs that build the data base.
  190.  
  191.       NOTE:  db_name is the filename path\prefix of the data base.
  192.  
  193.       GB_INDEX command line format:  
  194.  
  195.         GB_INDEX inf_file db_name scr_file <ENTER>
  196.  
  197.           inf_file:     ASCII file containing the path/names of
  198.                         input tagged data files.  GBMK_GBG will process
  199.                         all of the listed files, to produce a single
  200.                         db_name.GBG file.  
  201.                         Default name:  db_name.INF
  202.  
  203.           db_name:      This is the path/prefix to which .GBG will be
  204.                         appended to make the db_name.GBG file.
  205.  
  206.           scr_file:     Name of the script file for the data base.
  207.                         Default name:  db_name.SCR 
  208.  
  209.       Versions:  
  210.  
  211.         2.1   94/03/08
  212.             Added del SORTED.TXT, del MERGED.TXT.
  213.         2.0   93/12/15
  214.             Modified to use GBSORTC, GBSORTN, etc.
  215.             Added check for existence of necessary programs.  
  216.         1.0   93/11/01
  217.  
  218.  
  219.   GBXTRACT.EXE
  220.  
  221.       Reads db_name.GBG file, db_name.SCR file and STOPWORD.LST file.
  222.       Extracts field(s) and generates XTRACTED.TXT file.  Extracted search
  223.       terms are parsed according to the stop characters specified in the
  224.       .SCR file, and are compared to the stop words in STOPWORD.LST if
  225.       the stop word flag is set.  For non-numeric fields, spaces at the 
  226.       beginning of each extracted term are skipped. 
  227.  
  228.       Normally data fields are indexed one at a time.  However, up to
  229.       25 fields may be extracted at one time, to provide global indexing 
  230.       capability.  Globally indexed fields must all be of the same type, 
  231.       with no mixing of numeric and character-based fields.
  232.     
  233.       NOTE:  db_name is the filename path\prefix of the data base.
  234.  
  235.       Generates GBXTRACT.ERR file if a processing error is encountered.
  236.  
  237.  
  238.       GBXTRACT command line format:  
  239.   
  240.         GBXTRACT gbg_name script_name indexnum [indexnum ...]<ENTER>
  241.   
  242.           gbg_name:     Name of the data file for the data base.
  243.                         Default name:  db_name.GBG 
  244.   
  245.           scr_name:     Name of the script file for the data base.
  246.                         Default name:  db_name.SCR 
  247.   
  248.           indexnum:     number of data field to extract (integer)
  249.                         A max of 25 field numbers may be entered.
  250.  
  251.       Versions:  
  252.  
  253.         1.9   93/02/17
  254.            Revised to only update counter every 10 records.
  255.         1.8   93/01/31
  256.            Revised to skip spaces at beginning of extracted character term.
  257.         1.7   93/01/18
  258.            Added tests for available disk space.
  259.         1.6   93/11/03
  260.            Changed buffer sizes to allow records up to 32k bytes.
  261.         1.5   93/10/19
  262.            Changed CR/LF stopchar in non-formatted field to 255 (0xFF).
  263.         1.4   93/10/04
  264.            Added goto nextfield if non-numeric found in field type N. 
  265.            Added data field type n for multiple-entry numeric fields.
  266.         1.3   93/10/01
  267.            Changed name of Fields structure to DataFields to avoid
  268.              type clash with Fields structure in GSSEARCH.H
  269.            Forced insertion of CR/LF or 0 into stop character list.    
  270.         1.2   93/08/15
  271.            Revised command line message trigger and added output
  272.              of GBXTRACT.ERR file.
  273.            Fixed bug in fread trigger.
  274.         1.1   93/07/14
  275.  
  276.  
  277.   GBSORTC.EXE  01/06/93
  278.   GBSORTN.EXE  01/06/93
  279.  
  280.       Reads the XTRACTED.TXT file and sorts it, generating SORTED.TXT.
  281.       GBSORTC sorts character field output, GBSORTN sorts numeric field 
  282.       output.  NOTE:  Renamed from SORT.EXE, NSORT.EXE.
  283.  
  284.  
  285.   GBMERGEC.EXE  01/06/93
  286.   GBMERGEN.EXE  01/06/93
  287.  
  288.       Reads SORTED.TXT file and merges duplicate indexes, generating
  289.       MERGED.TXT.  GBMERGEC merges character field output, GBMERGEN merges
  290.       numeric field output.  NOTE:  Renamed from MERGE.EXE, NMERGE.EXE.
  291.  
  292.  
  293.   GBCOUNTC.EXE  01/06/93 
  294.   GBCOUNTN.EXE  02/16/94
  295.  
  296.       Reads MERGED.TXT file and counts indexes terms, and concatenates
  297.       index address information into db_name.LV1 -- db_name.LV4 files.  
  298.       GBCOUNTC works on character field output, GBCOUNTN works on numeric 
  299.       field output.  NOTE:  Renamed from COUNT.EXE, NCOUNT.EXE.
  300.  
  301.  
  302.   COLOR.EXE
  303.  
  304.       Changes color of menu screen.
  305.  
  306.       Command line format:
  307.  
  308.         COLOR colorstring <ENTER>
  309.  
  310.           where colorstring consists of a 2 or 3 character color defined as:
  311.   
  312.                  intensity (Optional)
  313.                           - = low intensity (default)          
  314.                           + = high intensity          
  315.                                             
  316.                  colors:  R = Red          
  317.                           G = Green          
  318.                           B = Blue          
  319.                           Y = Yellow          
  320.                           M = Magenta          
  321.                           C = Cyan          
  322.                           W = White          
  323.                           K = blacK          
  324.  
  325.       EXAMPLE:  COLOR -WB <ENTER>          
  326.  
  327.  
  328.   GSMENU.EXE, GSMENU.DAT
  329.  
  330.       See GSMENU.DOC.
  331.  
  332.  
  333.   GSBUILD.MNU
  334.  
  335.       Menu data file for GSMENU.EXE.  This calls the programs to build
  336.       the data base.
  337.     
  338.  
  339.   PREPB.EXE, PREPC.EXE
  340.  
  341.       Programs which allow interactive generation of the data base control
  342.       files db_name.TMP and db_name.SCR.
  343.     
  344.  
  345.   START.BAT
  346.  
  347.       Batch file which starts the GSMENU.EXE program using the GSBUILD.MNU 
  348.       data file.
  349.  
  350.     
  351.   BUILD.BAT
  352.  
  353.       Batch file which starts the build process.  This calls INDEX.BAT, and
  354.       provides file control information as part of the command line format:
  355.   
  356.         db_path\INDEX.BAT INF_file db_path\db_name SCR_file
  357.   
  358.   
  359.   INDEX.BAT
  360.  
  361.       Batch file which controls the building of the data base.  Generated by
  362.       PREPB.EXE.  At each step, if a .ERR file is found the processing will 
  363.       stop.
  364.  
  365.   GBCHKTAG.EXE
  366.  
  367.       Checks a .TAG file for errors.  Tests for extra curly brackets, 
  368.       control characters, tag names or records which are too long.  
  369.       Prints a list of field names, and errors found with line and byte 
  370.       number of occurrence.
  371.  
  372.       Command line format:
  373.  
  374.         GBCHKTAG tag_file output_file <ENTER>
  375.  
  376.           tag_file:     The path\name of the output tagged text file.
  377.  
  378.           dbf_file:     The path\name of the output data file.
  379.  
  380.       Versions:  
  381.         2.3   04/08/94 
  382.            Added record and byte counters.
  383.            Renamed from CHK_TAGS.
  384.         2.2   12/20/93 
  385.            Added test for unmatched curly brackets.
  386.            Removed test for tildes.
  387.            Moved reread section to get rid of bug giving erroneous 
  388.              error messages for "non-consecutive" CR and LFs.
  389.         2.1   11/03/93 
  390.            Revised record test length to 32768 bytes.
  391.         2.0   10/06/93 
  392.            Added test for record length.
  393.         1.0   03/12/93
  394.  
  395.  
  396.   GSSEARCH.EXE, GSSEARCH.HLP
  397.  
  398.       See GSSEARCH.DOC
  399.  
  400.  
  401.   GSMK_HLP.EXE 
  402.  
  403.       Program which allows user to make a database specific help file, which
  404.         is accessed by GSSEARCH.EXE.  
  405.       See GSSEARCH.DOC for more information.
  406.  
  407.       Versions:  
  408.  
  409.         4.0   94/01/11
  410.            Revised to allow general data base help input as prefix.TXT.
  411.         3.0   93/12/07
  412.            Revised to put help text offsets for GSSEARCH.HLP at actual 
  413.              offset instead of offset+1.
  414.            Revised to add CTRL-Z to end of text if not already present.
  415.         2.0   93/08/15
  416.            Changed to start with index field 0, and to allow 
  417.              non-sequential numbers (i.e. skipped numbers. )
  418.         1.0   Unknown
  419.           
  420.  
  421.  
  422.  
  423. FILE FORMATS & INFORMATION
  424.  
  425.   progname.ERR
  426.  
  427.       Error file generated by programs in the GSBUILD software system.
  428.       Contains error message describing the processing fault encountered.
  429.     
  430.  
  431.   db_name.CFG
  432.  
  433.       See GSSEARCH.DOC.
  434.     
  435.  
  436.   db_name.GBG
  437.  
  438.       See GSSEARCH.DOC.
  439.     
  440.  
  441.   db_name.HLP      
  442.  
  443.       See GSSEARCH.DOC.
  444.     
  445.  
  446.   db_name.LV1 ... db_name.LV4
  447.  
  448.       See GSSEARCH.DOC.
  449.     
  450.  
  451.   db_name.TMP     
  452.  
  453.       Prototype Configuration file (ASCII file) generated by PREPB.EXE
  454.       from db_name.DBF and interactive input.
  455.                  
  456.       Line #                          Contents
  457.  
  458.         1                          Name of configuration file to make.
  459.         2..7                       Path/names of pointer and data files.
  460.         8                          # data fields. (Y)
  461.         9                          # indexed fields (X)
  462.        10                          # browse formats specified
  463.        11                          Title line
  464.        12..X+12                    Indexed field data lines
  465.                                      Index name (12 chars max)
  466.                                        tilde character (stop read marker)
  467.                                      Index type (integer)
  468.                                            1 = numeric, 
  469.                                            3 = character;   
  470.                                      Data field number (starting with 0)
  471.        X+12..X+12+Y                Data field data lines
  472.                                      Data field name (10 chars max)
  473.                                        tilde character (stop read marker)
  474.                                      Index type (integer)
  475.                                            C = character, 
  476.                                            c = character (long),
  477.                                            M = memo,   
  478.                                            N = numeric;
  479.                                      Data field length.  For Numeric fields
  480.                                        the number of decimal places is 
  481.                                        indicated by an integer following a
  482.                                        slash (/), e.g. 5/2.    
  483.        Y+1                         Browse format #1 header line
  484.        Y+2                         Browse format #1 data line
  485.        Y+3                         Browse format #2 header line
  486.        Y+4                         Browse format #2 header line
  487.        ...
  488.        
  489.       Example:
  490.  
  491.         HCDN.CFG
  492.         \HCDN\HCDN.LV1~
  493.         \HCDN\HCDN.LV2~
  494.         \HCDN\HCDN.LV3~
  495.         \HCDN\HCDN.GBG~
  496.         \HCDN\HCDN.HLP~
  497.         \HCDN\HELP.GBG~
  498.         10
  499.         6
  500.         2
  501.         ***     HCDN TEST 06/08/93     *** ~
  502.         Sta_Num     ~   3   0
  503.         Sta_Name    ~   3   1
  504.         Region      ~   3   2
  505.         Sub_Region  ~   3   3
  506.         Drain_Area  ~   1   4
  507.         State       ~   3   7
  508.         STA_NUM   ~       8    C
  509.         STA_NAME  ~      48    C
  510.         REGION    ~      51    C
  511.         SUB_REGION~      51    C
  512.         DRAIN_AREA~       8/2  N
  513.         NUM_YEARS ~       3/0  N
  514.         COMMENTS  ~      500   C
  515.         STATE     ~       2    C
  516.         LATITUDE  ~       6/4  N
  517.         LONGITUDE ~       7/4  N
  518.         -1StaNum   Station Name              State  Drn Area   Lat   Lon    ~
  519.         1 1 8  2 10 25  8 36 2  5 40 10 9 52 6 10 60 7 0 0 0 0 0 0 0 0 0 0 0 0
  520.         -2Sta_Num   Station Name             Area   ~
  521.         1 0 8  2 9 40  5 52 8  0 0 0  0 0 0  0 0 0  0 0 0  0 0 0  0 0 0  0 0 0
  522.  
  523.     
  524.   db_name.TAG      TAGGED TEXT file (ASCII file)
  525.   
  526.       Contains data field-tagged record data.  The record data is listed 
  527.       sequentially by data field.  Fields must appear in the same order in 
  528.       the record as the list of field names in db_name.SCR.  Only those
  529.       fields with data should appear in the record.  Each record must 
  530.       end with the {EOR} (end of record) field.  Records may be arranged
  531.       with one field per line or may be concatenated on one line.  Blank 
  532.       lines between records are ignored.
  533.       
  534.       Field names -- MUST be delimited by left and right curly brackets;
  535.                   -- may be no more than ten characters, excluding brackets;
  536.                   -- may not contain blanks;
  537.                   
  538.       Data may contain hard carriage returns.  This allows retention of 
  539.       format for tables.  
  540.       
  541.       Data MAY NOT CONTAIN tilde (~) characters.  These are used as 
  542.       delimiting characters within the WORDNDX.TXT file.  
  543.  
  544.       Data MAY NOT CONTAIN any control characters except carriage 
  545.       return (CR) and line feed (LF). 
  546.  
  547.       CHK_TAGS.EXE may be used to check a TAG file for the
  548.       existence of tilde characters, control characters, as well as
  549.       other format errors.
  550.  
  551.       Example:
  552.  
  553.         {OFFICE}WRD
  554.         {ROOM}SUITE 5
  555.         {MAILCITY}Lansing
  556.         {STATE}MI
  557.         {WACODE}517
  558.         {FTSNO}374-1608
  559.         {DEPT}DOI
  560.         {BUREAU}USGS
  561.         {CTRLDATE}06/25/89
  562.         {ELEV}  127.3
  563.         {FIRST}Brian
  564.         {MI}D.
  565.         {LAST}Abbott
  566.         {EOR}
  567.         ... more records ...
  568.  
  569.                   
  570.   SIZE.TXT file   (ASCII file)
  571.  
  572.       Contains pointer data for each indexed field in the data base.
  573.       Default name:  SIZE.TXT
  574.       NOTE:  SIZE.TXT is produced by GBMK_ADR.EXE.
  575.  
  576.       Example:
  577.  
  578.         2  1000  100   0       0  0
  579.         2  1000  214  60    3200  0
  580.         2  1000   47 120   10048  0
  581.         2  1000    2 180   11552  0
  582.         2  1000   12 240   11616  0
  583.         2  1000   95 300   12000  0
  584.  
  585.  
  586.   db_name.SCR      SCRIPT DATA FILE (ASCII file)  
  587.  
  588.       File containing information on the indexing parameters for the
  589.       data base.
  590.  
  591.       For EACH data field contains:
  592.  
  593.            the data field name,         NOTE:  Data field name must be 
  594.                                         ended with a tilde (~) character.  
  595.                                         Maximum of 10 characters.
  596.  
  597.            data field indexing flag,    0 = do not index field 
  598.                                         1 = index field
  599.  
  600.            retain format flag,          Allows retention of format of
  601.                                         tables, etc.  Setting this to 1 
  602.                                         for numeric fields allows retention
  603.                                         of leading blanks for formatting.
  604.  
  605.                                         0 = wrap data;
  606.  
  607.                                             Leading spaces are eliminated.  
  608.  
  609.                                             CR/LF characters are converted
  610.                                             to spaces except when this would 
  611.                                             result in two consecutive spaces.
  612.                                             Consecutive CR/LF characters are
  613.                                             converted to a single space.
  614.                                             
  615.                                         1 = retain format; 
  616.  
  617.                                             CR/LF characters are converted 
  618.                                             to 00.
  619.  
  620.            stop character string,       List of characters to use as
  621.                                         delimiters between words for
  622.                                         indexing.
  623.  
  624.                                         Ignored if field is not indexed.
  625.                                         Stop characters should NOT be used
  626.                                         if the field is numeric.
  627.  
  628.                                         NOTE:  Stop character list strings 
  629.                                         must be ended with a tilde (~) 
  630.                                         character.  
  631.  
  632.                                         S for the stop character string 
  633.                                         denotes the standard stop character
  634.                                         set for character fields:
  635.  
  636.                                                       space
  637.                                                  ;    semicolon
  638.                                                  .    period
  639.                                                  :    colon
  640.                                                  ,    comma
  641.                                                  '    apostrophe
  642.                                                  ?    question mark
  643.                                                  -    dash (minus sign)
  644.                                                  ()   parentheses
  645.                                                  *    asterisk
  646.                                                  _    underscore
  647.                                                  ^    caret
  648.                                                  CR   carriage return
  649.                                                  LF   line feed
  650.                                                  "    double quote
  651.  
  652.                                         N for the stop character string 
  653.                                         denotes the standard stop character
  654.                                         set for NUMERIC fields:
  655.                                         
  656.                                                       space
  657.                                                  CR   carriage return
  658.                                                  LF   line feed
  659.  
  660.                                         D for the stop character string 
  661.                                         denotes the standard stop character
  662.                                         set for DATE fields:
  663.                                         
  664.                                                       space
  665.                                                  CR   carriage return
  666.                                                  LF   line feed
  667.  
  668.                                         NOTE:  Processing may be speeded
  669.                                         considerably if the most likely 
  670.                                         stop characters (i.e. space, comma,
  671.                                         period, etc.) are placed early in
  672.                                         the list.  
  673.  
  674.            stop words use flag,         0 = index all words,
  675.                                         1 = DO NOT INDEX words found in
  676.                                             STOPWORD.LST file;
  677.  
  678.                                         Ignored if field is not indexed.
  679.  
  680.                                         See documentation on STOPWORD.LST
  681.                                         file.
  682.  
  683.            data field type              C = Character, short
  684.                                         c = Character, long            
  685.                                         D = Date (mm/dd/yy)    
  686.                                         M = Memo
  687.                                         N = Numeric, first word of field
  688.                                             is the number.  Subsequent words
  689.                                             in the field are ignored.
  690.                                         n = Numeric, with multiple numbers 
  691.                                             in the same data field.  
  692.                                             Non-numeric words are ignored.
  693.                                             This type is useful for indexing 
  694.                                             numeric tables.
  695.  
  696.                                         NOTE:  Commas will be removed from 
  697.                                                N and n numbers.
  698.  
  699.       Example:
  700.  
  701.         field      index    format    stop            stopword    field
  702.         name       flag     flag      characters      flag        type
  703.  
  704.  
  705.         OFFICE~       1        0        S~              0           C
  706.         ROOM~         1        0        S~              0           C
  707.         MAILSTOP~     1        0        !@# %-_~        0           C
  708.         MAILCITY~     1        0        S~              0           C
  709.         STATE~        1        0        S~              0           C
  710.         WACODE~       1        0        S~              0           C
  711.         FTSNO~        1        0        S~              0           C
  712.         WEXCH~        1        0        S~              0           C
  713.         WEXT~         1        0        S~              0           C
  714.         DEPT~         1        0        S~              0           C
  715.         BUREAU~       1        0        S~              0           C  
  716.         REMARKS~      1        0        S~              1           C
  717.         CTRLDATE~     1        0        D~              0           D
  718.         ELEV~         1        1        N~              0           N
  719.         FIRST~        1        0        S~              0           C
  720.         MI~           1        0        S~              0           C
  721.         LAST~         1        0        S~              0           C
  722.         EOR~          0        1        S~              0           C
  723.  
  724.         NOTES:  The STATE field was flagged to not use stop words because
  725.                 their use would eliminate OR, IN and ND.  Eliminating their
  726.                 use in the other fields (except REMARKS) also speeds 
  727.                 processing.
  728.  
  729.                 The CTRLDATE field has a format of MM/DD/YY.  It was
  730.                 flagged to use a stop character which would NOT appear
  731.                 in the field so if would not be broken on the / characters.
  732.  
  733.                 The ELEV field is numeric.  The stop character flag is
  734.                 therefore set to N, signifying the standard numeric stop
  735.                 characters (space,CR,LF).  It is also formatted with 
  736.                 leading spaces to get the decimal places to line up in the
  737.                 browse display.  In order to retain them the field was 
  738.                 flagged to retain the format.
  739.  
  740.  
  741.   STOPWORD.LST (ASCII file)
  742.  
  743.       List of words to be excluded from indexing.  Words must be arranged
  744.       one word to a line.  All words will be converted to all capitals by
  745.       the software.  Words do not need to be alphanumerically sorted.  
  746.       Words must be continuous, i.e. no spaces within words. There may be 
  747.       no blank lines between words.  
  748.   
  749.       NOTE:  The normal stop word list contains IN, OR, and ND.  Therefore
  750.       the stopwords should not be used when indexing a field which contains
  751.       state abbreviations, since Indiana, Oregon, and North Dakota will be
  752.       excluded.  
  753.  
  754.       Maximum number of words = 200.
  755.       Maximum length of word  = 10 characters.
  756.  
  757.       Example:
  758.  
  759.         ABOUT
  760.         AFTER
  761.         ALL
  762.         ALSO
  763.         AMONG
  764.         AN
  765.         AND
  766.         ANY
  767.         ... more words ...
  768.  
  769.       
  770.   XTRACTED.TXT      (Binary file)
  771.  
  772.       This file is generated by GBXTRACT.EXE, and is normally deleted
  773.       after each index extraction.  
  774.  
  775.       Contains information for each "term" indexed for the specified field.
  776.       The information for each index term is contained in a block of 40
  777.       bytes, consisting of a 10 byte header and a 30 byte word area, which 
  778.       is arranged as follows:  
  779.  
  780.           Bytes      Use                                      Type 
  781.         
  782.           0 ..  1     Record length in db_name.GBG file;      int
  783.           2 ..  5     Record offset in db_name.GBG file;      long
  784.           6 ..  7     # of word in data field;                int
  785.           8 ..  9     Data field number;                      int
  786.          10 .. 39     Term, padded with trailing spaces       char[30]
  787.                       Character fields start at byte 10.
  788.                       Numeric fields are right justified with the
  789.                         decimal point at byte 30.  If there is no
  790.                         decimal point the ones digit is at byte 29.
  791.  
  792.